小寺・西田の「金曜ランチビュッフェ」より

テープ起こしの悩みを解決できるか? カシオのアプリ「キーワード頭出し ボイスレコーダー」を試す

今回は、別途機材を用意する時間もなかったので、iPhone 6 Plusにアプリを入れ、内蔵マイクで録音するという、もっともシンプルな(そして、多くの人が行なうであろう)方法で使った。インタビューは、対象一人に質問者として自分が一人。双方の間にiPhoneを置き、相手にマイクを向けて録音した。といっても、まったく真ん中というわけではなく、筆者の方により近かった。この条件が、のちのち大きく効いてくる。取材場所は普通のオフィスだが、オープンスペースだったので、周囲の環境音も入っている。要は「そこそこ条件が悪いが、特別な環境ではない」状態だ。

「キーワード頭出し ボイスレコーダー」では、録音品質を複数の候補から選べるが、今回はデフォルト(もっとも品質が低く、データ量が小さくなる条件)にしている。具体的には、コーデックはADPCMで、周波数は16000Hz。最高品質の場合、リニアPCMかつ周波数48000Hzで記録できるが、あえて「普通の設定でどのくらいいけるか」を試す意図があった。

このアプリでは、録音時に、同時に声から「音」の情報を分析するようだ。テキストにしてしまうわけではないが、「どんな音の言葉を話しているか」を最終的に検索するための元になるデータをここで作っているようだ。

そして、実際に検索するには、できたデータを後処理する必要がある。「アプリ用データの作成」と表現されているが、これにはかなりの時間がかかる。アプリはバックグラウンド動作にしていいが、スリープさせると作業は止まる。だいたい録音時間の半分程度、との話だったが、筆者の場合、80分のインタビューのデータ化に50分程度かかった。

・「アプリ用データの作成」を警告する画面。時間がかかること、消費電力が多いことなどがわかる。

http://dl.dropbox.com/u/75917465/kn028/casio03.png

では、成果がどうかというと……。これはなかなか優秀だ。検索した部分を再生すると、たしかに、検索に使ったキーワードが出てくる。録音全体を聞いていないので、「検索に引っかからなかったワード」がどのくらいあったか、確実にわかっているわけではない。しかし、手元にあるメモと照合すると、そんなにずれてはいないようだ。

・検索してみると、音から「目的のキーワードを話している部分」がかなり的確に抽出される

もちろん、問題点もある。

まず第一に、検索対象は「かな」だ。同音異義語は同じものとしてピックアップされる。要は、このアプリは「音を抽出している」ものであって、意味を抽出しているわけでも、文章を作っているわけでもない、ということだ。

また、やってみると、想定よりもたくさんの検索結果が出てくる。理由は、こちらの質問に含まれるキーワードに、より多くヒットしていたからだった。その辺は、筆者が特に声がデカい……ということもあるだろうが、より関与度が高かったのは、マイクの場所が筆者に近く、インタビュイーの声よりも大きく拾われたからでは、と予想している。

このアプリは複数話者で認識を分けることはしていない。だから、大きい音でキーワードに近い言葉があれば、それをピックアップしてしまうわけだ。ライターが「テープ起こしをしたい」という場合、自分の質問でなく相手の答えを検索したいと思うものだが、話者を特定しないこのアプリの場合、こういう問題が起きる。

だからこのアプリは使えない……というつもりはまったくない。要は、相手の声がより大きく入るようにすればいい、ということなのだから。

またそもそも、本アプリは「テープ起こし」用ではない。講義などをメモしながら聴講した時、後でメモを見つつ「なんと言ったか確認したい」というニーズを満たすものだ。企業研修や大学の講義など、静かに聞いたものをメモする用途だと、この仕様でまったく問題ないだろう。

筆者のファーストインプレッションでいえば、これはなかなかのものだ。話者が少ないインタビューでは、けっこう有用なのではないだろうか。おそらく、会見メモでも価値が出そうだ。問題は、バッテリーと時間が潤沢な時でないと、インデックス作成が厳しいことだろうか。だが、致命的なものとはいえない。

筆者以外にもアプリを試した人はいて、「うまくいかない」という事例も聞いている。どうも理由が判然としないので、評価を定めにくい。

しかし、ボイスレコーダーのような、枯れたアプリに新しい、しかも理想的な競争軸を持ち込んだ、というあたりは、とても好ましい。どんどん完成度を上げていってほしい。

そして、願わくばAndroid用も。バックグラウンドで処理しやすいので、iOSより向いているのでは、と思うのだ。

小寺・西田の「金曜ランチビュッフェ

2015年3月17日 Vol.028 <損得のパワーバランス号>目次
今週の目次

01 論壇(小寺)
TPP知財条項に反対する、それぞれの理由
02 余談(西田)
テープ起こしの悩みを解決できるか? カシオの「キーワード頭出し ボイス
レコーダー」を試す
03 対談(西田)
鷹野凌氏に聞く「日本独立作家同盟が生まれた理由」(1)
04 過去記事アーカイブズ(小寺)
未曾有の大惨事に立ち向かう日本企業
05 ニュースクリップ(小寺・西田)
06 今週のおたより(小寺・西田)

12コラムニスト小寺信良と、ジャーナリスト西田宗千佳がお送りする、業界俯瞰型メールマガジン。 家電、ガジェット、通信、放送、映像、オーディオ、IT教育など、2人が興味関心のおもむくまま縦横無尽に駆け巡り、「普通そんなこと知らないよね」という情報をお届けします。毎週金曜日12時丁度にお届け。1週ごとにメインパーソナリティを交代。

 

ご購読・詳細はこちらから!

 

筆者:西田宗千佳

フリージャーナリスト。1971年福井県出身。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。取材・解説記事を中心に、主要新聞・ウェブ媒体などに寄稿する他、年数冊のペースで書籍も執筆。テレビ番組の監修なども手がける。

 

1 2

その他の記事

「常識」の呪縛から解き放たれるために(甲野善紀)
俺らの想定する「台湾有事」ってどういうことなのか(やまもといちろう)
週刊金融日記 第308号【日本の大学受験甲子園の仕組みを理解する、米国株は切り返すも日本株は森友問題を警戒他】(藤沢数希)
GAFA+Nの存在感、その価値の本質(本田雅一)
怒って相手から嫌われることのメリット(岩崎夏海)
なかなか技あり、行列を緩和する「イベントアプリ」(西田宗千佳)
失ってしまった日本ならではの自然観(高城剛)
アーユルヴェーダで本格的デトックスに取り組む(高城剛)
音声で原稿を書くとき「頭」で起きていること(西田宗千佳)
人生に一発逆転はない–心の洗濯のススメ(名越康文)
テレビと政治の関係はいつから変質したのか(津田大介)
カビ毒ダイエットという新しい考え方(高城剛)
鉄腕アトムの呪い(西田宗千佳)
銀座の通りにある歩道の意味(高城剛)
中国発「ビリビリ動画」の米NASDAQ上場と、日本の「ニコニコ動画」の終わりっぷり問題(やまもといちろう)

ページのトップへ